美國德州引入AI改卷 教育工作者憂寫作表達方式受限 學生隨時考0分
德州教育局(TEA)引入的「自動評分引擎」主要針對評改 STAAR 考試中的開放式問題答案,系統能支援聊天機械人,如 ChatGPT 去了解用户並與其溝通。
在修改了2023年的 STAAR 考試後,當局減少了多選題的數量,並將開放式問題增加了6至7倍。德州教育局的學生評估主任 Jose Rios 表示,我們希望保留盡可能多的開放式問題,但是這需要大量的時間來評分。
一些德州各地的教育工作者對當局決定使用 AI 改卷,感到意外。其中一個原因是 STAAR 考試對校園和學區十分重要,家長和老師質疑 AI 評分的能力,認為比不上人工評分員,對此感到不安。他們憂慮學生在寫作中展現自己的看法和獨創性而無法得分。
獨立學區負責人 Lori Rapp 指,去年12月,仍在有限度地使用自動評分系統時,校區被評為0分的答案急劇增加。可是,他認為仍無法確定是用以測試的問題還是系統出錯。
為了開發評分系統,TEA 收集了3,000份經過兩輪人工評分的答卷,進行訓練。在今年春季,正式使用系統時亦會推行安全措施,系統先為所有開放式問題進行評分,之後四分之一的回應再由人工評分員重新批改,包括一些有機會令 AI 混淆的答案,如包含非英文和俚語。
TEA預計,「自動評分引擎」將帶來強大的經濟效益。由於系統能取代大量人類評卷員,相較去年的6,000人,今年只聘請了2,000人,故估計每年可節省1,500至2,000萬美元(約1.2億至1.6億港元)。